home *** CD-ROM | disk | FTP | other *** search
/ Internet Info 1997 December / Internet_Info_CD-ROM_Walnut_Creek_December_1997.iso / ietf / urn / urn-archives / urn-ietf.archive.9611 / 000001_owner-urn-ietf _Fri Nov 1 06:13:13 1996.msg < prev    next >
Internet Message Format  |  1997-02-19  |  3KB

  1. Received: (from daemon@localhost) by services.bunyip.com (8.6.10/8.6.9) id GAA25071 for urn-ietf-out; Fri, 1 Nov 1996 06:13:13 -0500
  2. Received: from mocha.bunyip.com (mocha.Bunyip.Com [192.197.208.1]) by services.bunyip.com (8.6.10/8.6.9) with SMTP id GAA25066 for <urn-ietf@services.bunyip.com>; Fri, 1 Nov 1996 06:13:11 -0500
  3. Received: from josef.ifi.unizh.ch by mocha.bunyip.com with SMTP (5.65a/IDA-1.4.2b/CC-Guru-2b)
  4.         id AA03771  (mail destined for urn-ietf@services.bunyip.com); Fri, 1 Nov 96 06:13:09 -0500
  5. Received: from ifi.unizh.ch by josef.ifi.unizh.ch 
  6.           id <01729-0@josef.ifi.unizh.ch>; Fri, 1 Nov 1996 12:11:38 +0100
  7. Subject: Re: [URN] New syntax draft
  8. To: jayhawk@ds.internic.net
  9. Date: Fri, 1 Nov 1996 12:11:37 +0100 (MET)
  10. Cc: urn-ietf@bunyip.com
  11. In-Reply-To: <9610312029.AA28199@mocha.bunyip.com> from "Ryan Moats" at Oct 31, 96 02:29:20 pm
  12. Mime-Version: 1.0
  13. Content-Type: text/plain; charset=US-ASCII
  14. Content-Transfer-Encoding: 7bit
  15. Content-Length: 1952
  16. From: Martin J Duerst <mduerst@ifi.unizh.ch>
  17. Message-Id: <"josef.ifi..673:01.10.96.11.11.39"@ifi.unizh.ch>
  18. Sender: owner-urn-ietf@services.bunyip.com
  19. Precedence: bulk
  20. Reply-To: Martin J Duerst <mduerst@ifi.unizh.ch>
  21. Errors-To: owner-urn-ietf@bunyip.com
  22.  
  23. Ryan Moats wrote:
  24.  
  25. >On Thu, 31 Oct 1996 11:58:35 +0100 (MET), Martin J Duerst wrote:
  26. >
  27. >>>   It should be noted that certain characters in the Namespace Specific
  28. >>>   String syntax may have special meaning in certain namespaces.
  29. >>>   Therefore, the process of registering a namespace identifier shall
  30. >>>   include publication of a definition of which characters have a
  31. >>>   special meaning and how to encode these characters if used in a
  32. >>>   literal sense.
  33. >>
  34. >>Can they be encoded with %HH? Or should we specifically request some
  35. >>other mechanism in order to not confuse different things, and let
  36. >>programs that deal with URNs in general change from %HH to 8-bit
  37. >>and back?
  38. >
  39. >Well, I don't have a current opinion one way or the other.  Thinking about
  40. >it some more, I don't see how we can avoid %HH encoding, so why not
  41. >just say that encoding must be specified if %HH isn't used.
  42.  
  43. When going from ASCII to UTF-8, there are some new problems.
  44. For ASCII, the general assumption is that only those charcters
  45. that need escaping are actually escaped, and therefore that
  46. escaping, e.g. for "/" or whatever, shouldn't be undone.
  47. The above is not exactly true, indeed the "~" is often escaped
  48. as %7E in Europe because it is difficult to type on European
  49. keyboards, but still I assume there are a lot of tools around
  50. working on URLs in general that work along the rule "if ASCII
  51. is escaped, don't remove the escaping, because this is a special
  52. character.
  53. Now for UTF-8, things are quite different. 8-bit bytes will
  54. on many occasions be escaped because it may be difficult to
  55. represent them otherwise. Having some character beyond ASCII
  56. represented with %HH (usually %HH%HH or %HH%HH%HH) can in no
  57. way imply that this is a special character.
  58. This means that any tools dealing with URNs in general will
  59. have no clue about where to keep the escaping, and where
  60. to remove it. A very exact knowledge of each NSS syntax
  61. would be needed.
  62.  
  63. Regards,    Martin.